Пирумова Л.Н., Давидович Е.А., Мальцева Б.М.

ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС КАК ТЕРМИНОЛОГИЧЕСКАЯ БАЗА АПК

Тезаурус часто называют терминологической сокровищницей, поскольку он собирает, накапливает терминологию по определенной области знания. Тезаурус – это контролируемый словарь лексических единиц дескрипторного языка, основанный на лексике естественного языка. Информационно-поисковый тезаурус является основным средством контроля лексики дескрипторного информационно-поискового языка (ИПЯ) с зафиксированными в нем семантическими и лексическими связями лексических единиц.

ИПТ по сельскому хозяйству и продовольствию (ИПТ) создан с целью повышения качества поиска информации в автоматизированной информационно-поисковой системе (ИПС) и выполняет следующие функции: индексирование входного документального потока, контролирование и нормализация лексики АПК, единообразие и формализация представления информации в ИПС, отражение парадигматических отношений, существующих между терминами отрасли знания. ИПТ представляет собой алфавитный перечень терминов, относящихся к области АПК и смежных с ним отраслей. Он пополняется новой терминологией из входного документального потока в ходе его аналитико-синтетической обработки, что позволяет пополнить его новыми терминами, отражающими современный уровень науки и практики. Статус терминологической базы АПК требует максимального насыщения ИПТ лексикой. Терминологическая база предполагает актуализацию и современные формулировки терминов, максимально полное отражение научных понятий, обозримость их в рамках определенной отрасли знания, что требует постоянной работы с ИПТ и его лексическими единицами: выявление устаревших формулировок, выявление пропусков в отражении какого-либо научного направления и т.д. Алфавитное расположение лексических единиц в ИПТ облегчает поиск нужного понятия, но осложняет выявление терминологических пропусков, поскольку сельское хозяйство и пищевая промышленность – политематические отрасли сами по себе и область их соприкосновения с другими областями науки и практики очень широка. Еще труднее выявить лакуны в терминологической области, относящейся к какой-либо отрасли АПК и смежных с ним областей. Чтобы понять объем, наполненность, полноту терминологической базы отдельной отрасли АПК в ИПТ, необходимо выделить всю относящуюся к ней терминологию в единый блок. Специалисту-отраслевику важно также иметь всю информацию об объеме и наполненности терминологической области, в которой он специализируется. Поэтому в ЦНСХБ Россельхозакадемии начата работа по созданию микротезаурусов, т.е. тезаурусов по отдельным отраслям АПК. Такие микротезаурусы являются терминологическими базами по этим отраслям, что полезно как ученым и практикам, так и индексаторам, поскольку каждый из них специализируется на обработке документов по отдельным отраслям АПК. Микротезаурусы позволяют выявить ошибки и неточности в ИПТ (в формулировке терминов, в их лексическом обрамлении); позволяют определить терминологические границы отрасли; выявить направления, не нашедшие отражения в ИПТ; создать терминологическую базу отдельной отрасли АПК. Микротезаурусы отражают все иерархические связи термина с понятиями из других областей знаний. В ходе создания микротезаурусов не только редактировалась уже представленная в нем терминология, но и происходило выявление терминологических лакун, пополнение микротезауруса новыми терминами, относящимися к данной области знаний, и отражающими документальный фонд ЦНСХБ. Термины, представленные в микротезаурусах, имеют все выявленные на момент работы с ним связи с терминами ИПТ из других терминологических областей. Таким образом, работа по созданию отраслевых микротезаурусов является также работой по редактированию и совершенствованию ИПТ по сельскому хозяйству и продовольствию, частью которого они являются.

Для создания микротезаурусов специалистами ЦНСХБ было разработано специальное программное обеспечение. Микротезаурусы созданы в электронной форме и представляют собой электронную версию отраслевого фрагмента ИПТ в соответствии с принятой формой представления терминологии в печатной и электронной форме ИПТ. Разработаны программные средства формирования печатной версии микротезаурусов. В ходе работы автоматизированным путем была отобрана лексика по двум терминологическим областям: ветеринарии и пищевой промышленности. Затем был проведен анализ терминов на принадлежность терминов к данным терминологическим областям и правильность их научной формулировки. Ненужные термины были удалены. Следующий этап работы заключался в редактировании каждой словарной статьи: статус термина, парадигматические связи, лексическое обрамление. Исправления путем формулирования корректорского предписания вводились как в микротезаурус, так и в ИПТ. В ходе работы над микротезаурусами был удален ряд терминов, не относящихся к данным терминологическим областям. В микротезаурус по ветеринарии была внесена новая классификация вирусов животных. Выявлены термины без лексического обрамления и снабжены парадигматическими связями. Микротезаурусы представлены в Интранет ЦНСХБ.

Hosted by uCoz